您现在的位置是:鹤壁市某某搬家培训中心 > 综合
教育智能体能否提升学生学习表现——基于国内外 87 篇实证文献的元分析
鹤壁市某某搬家培训中心2025-08-26 06:59:39【综合】6人已围观
简介教育智能体作为连接大模型与教学场景的重要桥梁,已成为推动智能化、个性化与精准化教学的关键工具。已有研究从不同角度探讨了教育智能体的应用效果,但其对学生学习表现的影响及内在机制仍有待明确。基于对87篇实
教育智能体作为连接大模型与教学场景的教育重要桥梁,已成为推动智能化、智能证文个性化与精准化教学的否提商洛市某某自动化科技有限公司关键工具。已有研究从不同角度探讨了教育智能体的升学生学应用效果,但其对学生学习表现的习表现基献的析影响及内在机制仍有待明确。基于对87篇实证文献的于国元分元分析结果表明:教育智能体整体上对学生学习表现具有中等偏小的正向促进作用,在认知能力层面的内外数字素养维度促进效果最强;学段与学科对学生学习表现无显著调节作用,但教育智能体是篇实否集成GAI、角色设定、教育社会特征及应用形式对其具有显著调节效应。智能证文进一步分析发现,否提具备集成GAI、升学生学扮演专家角色、习表现基献的析强调交互风格等特征的于国元分教育智能体对于提升学生的学习表现更具成效;具有「师—生—机」协同、知识生成导向教学模式等应用形式的内外教育智能体亦能显著促进学生的学习表现。为提高教育智能体应用效果,未来可基于最近发展区构建认知支架,强化协同支持以促进知识生成;融合多媒体认知学习理论,设计多元教学模式组合;警惕「快餐式知识」与幻觉输出,结合生成学习策略协同引导深度学习的发生。
文章来源:刘妍,李梦兴,李琳(2025).教育智能体能否提升学生学习表现——基于国内外87篇实证文献的元分析[J].现代远程教育研究,37(4):23-33.
1.教育智能体的发展
智能体的概念源于计算机科学中对「Agent」的定义,指一种具备环境感知、自主应答与任务执行能力的智能程序(李杨等,2018)。教育智能体本质是一类嵌入教学场景、融合人工智能技术的虚拟角色,能基于学习者的认知特征和学习风格,提供个性化反馈与交互支持(刘清堂等,2019;Dever et al.,2024)。早期的教育智能体多扮演导学角色,辅助教师答疑(何克抗,2017);随着生成式人工智能(Generative Artificial Intelligence,GAI)、语音识别与多模态交互等技术的发展,教育智能体逐步向着融合认知推理与执行能力的智能辅学系统方向演进,既可支持师生互动,也能满足个性化学习需求(郭鑫等,2023;Guo et al.,2024)。近年来,国内外涌现出多种教育智能体的应用形态,如Khan Academy推出的Khanmigo、国内高校部署的多教育智能体平台,以及交互式「教师分身」和电子白板教育智能体等(Alrajhi,2024;人民网,2025)。教育智能体已广泛应用于学习评估、资源推荐、协同学习等场景(徐振国等,2021;卢宇等,2024),并成为支持协同教学、协同学习与协同决策等教育实践的重要力量(黄荣怀等,2025)。
2.教育智能体与学生学习表现的关系
在教学场景中,教育智能体通过任务分解、策略推荐与反馈调节为学习者提供即时支持,提升了学习者的学习效率与深度(Van de Pol et al.,2010;顾小清等,2025)。集成GAI的教育智能体借助多模态信息交互与实时生成的能力,灵活调整生成内容与问答方式(刘石奇等,2025),引导学生参与知识建构,实现从知识被动接收到知识生成的转变(朱永海等,2025)。与此同时,亦有研究指出由GAI驱动的教育智能体在生成内容过程中可能带来幻觉现象,存在知识不匹配、过度依赖(姜华等,2023)与削弱深度理解(Bastani et al.,2024)等风险。为考察教育智能体对学习产生的影响,研究者们通过实验或准实验进行了大量研究,但得出的结论不尽相同。本研究将其结论归纳为三类。
一是教育智能体对学生学习具有促进作用。现有研究普遍认为,教育智能体可通过即时反馈与路径规划增强学生的学习成效、自我效能感与数字素养表现(Duffy et al.,2015;Alrajhi,商洛市某某自动化科技有限公司2024;Hwang et al.,2024),可以显著改善学业表现(唐烨伟等,2023),有效提升学习动机等非认知能力(周晓燕等,2023)。例如,Draxler等人(2022)借助基于文本的单教育智能体开展了为期半年的实验研究,发现对教育智能体的熟练运用能有效提升大学生的学习动机与知识接受能力,且流畅的交互能促进其学习表现。Ait Baha等人(2024)将AI支持的教育智能体融入编程教育中,并对109名中学生开展教学对比实验,发现使用教育智能体的实验组具有更好的结果表现,且团队能力均有一定提升。Zhang & Zhang等人(2024)的研究表明,集成GAI的多教育智能体协同教学有助于增强学生互动并提升其学业成绩。
二是教育智能体对学生学习没有显著影响。例如,Farah等人(2023)在Python课程中引入教育智能体作为教师助理,发现参与课程的大学生在学习收益和课程感知有用性方面没有显著变化。Ortega-Ochoa等人(2024)采用准实验研究,发现具备同理心的教育智能体在促进学生学习、激发学生学习兴趣和提升学生自我调节能力方面与人类教师并无显著差异。Kahyaoğlu等人(2024)从教育智能体的跨模态认知传导特性出发进行研究,发现不同实验组在认知负荷、心流体验和技能水平上均无显著差异。Hwang等人(2024)则指出,教育智能体的角色设定与外貌变化对初中生学习动机未产生显著影响。
三是教育智能体对学生学习有负面影响。教育智能体过度介入可能抑制高阶思维、削弱社交能力,甚至阻碍深度学习发展,其能否胜任教师角色仍存在争议(翟雪松等,2024;Lee et al.,2024;Dever et al.,2024)。例如,Bastani等人(2024)的研究表明,GAI赋能的教育智能体虽在短期内提升了高中生的学习成绩,但也可能引发依赖性与深度理解缺失,从而在长期内不利于学生学习能力的发展。Lin等人(2025)完成的一项关于AI赋能的教育智能体对学生语言学习影响的混合研究发现,如果难以通过语言交互风格区分教育智能体与人类教师,学生将会对所获信息的质量产生焦虑与不安,进而降低其持续学习的兴趣。此外,Zhang & Jaldi等人(2024)还发现,除教育智能体自身设计外,学习环境及学生的性别等因素在特定情境中可能限制其作用发挥,表现出文化适应性不足、学习动机受挫等问题。
3.研究问题
综上可知,已有研究从不同角度探讨了教育智能体的应用效果,但因为自变量、因变量和调节变量存在差异,研究结论仍存在显著分歧。为系统性探讨教育智能体对学生学习表现的影响机制,本研究将在实证文献基础上开展元分析,细化因变量分类,拓展调节变量体系,引入技术接入方式、智能体数量、人机协同方式与教学模式等多维因素,将单、多教育智能体作为独立调节变量加以比较,系统评估其在真实教学中对学习表现的影响。本研究旨在回应以下两个核心问题:(1)使用教育智能体是否有助于提升学生的学习表现?(2)使用教育智能体过程中,调节变量对学习表现的影响差异如何?本研究期望为教育智能体的优化设计与教学实践提供理论支撑与实践路径。
1.测量变量设计
(1)因变量:学习表现
不同研究所关注的学习表现类型存在差异,部分聚焦认知产出(如知识掌握、成绩表现),部分则强调非认知因素(如数字素养、学习动机、自我效能感),而这些指标本身在评价方式与实现路径上存在根本差异。因此,本研究参考Heckman等人(2012)对人类能力结构的划分,将学习表现界定为学生在教育智能体干预下的综合表现,涵盖认知能力与非认知能力两个维度。认知能力基于Kyllonen等人(2011)的划分方式,细化为四类:一是知识掌握,即对核心概念和事实性知识的理解与记忆;二是成绩表现,即标准化考试或课堂测验中的得分;三是问题解决能力,指在复杂情境中整合知识并做出判断的能力;四是表达交流能力,涉及语言组织与思维清晰度。非认知能力依据Brunello等人(2011)和Farrington等人(2012)的分类,包括数字素养、学习动机、学习投入、学习兴趣与自我效能感,强调其对学习行为与深度加工能力的调节作用。
(2)第一类调节变量:学段与学科
不同学段的学生在使用教育智能体后学习表现的变化不尽相同(Farah et al.,2023;Bastani et al.,2024;Hwang et al.,2024)。在偏工程和科学的任务中,教育智能体更能有效发挥其认知支持或路径推荐作用(Duffy et al.,2015;Ait Baha et al.,2024);而在综合性课程中,其效果往往更依赖个体差异与交互形式(翟雪松等,2024;Zhang et al.,2024a;Lin et al.,2025)。因此,本研究引入学段、学科作为第一类调节变量。
(3)第二类调节变量:教育智能体设计特征
教育智能体是否集成GAI(Duffy et al.,2015;Bastani et al.,2024;Ortega-Ochoa et al.,2024)、是否为多智能体(翟雪松等,2024;Draxler et al.,2022;Zhang & Jaldiet al.,2024)、角色设定(Alrajhi,2024;Hwang et al.,2024)及社会特征(Ortega-Ochoa et al.,2024;Zhang & Zhang et al.,2024;Lin et al.,2025)等设计特征都会对其应用效果产生影响。因此,本研究引入教育智能体设计特征作为第二类调节变量,包括GAI集成情况、智能体数量、角色设定及社会特征。
(4)第三类调节变量:教育智能体应用形式
教育智能体功能随着计算机视觉和交互能力发展而逐渐丰富,从认知层面的个性化资源提供逐步发展为伴学辅导、学习路径推荐、情感支持等多重功能(徐振国等,2021),并通过音频、文本、动作等多模态形式提供反馈或与学生交互(Draxler et al.,2022;Zhang & Zhang et al.,2024)。随着GAI智能体深度融入教学,其逐步改善了人机协同方式,成为教师、学生和AI协作的桥梁,搭建起了「师—生—机」三元协同的学习环境,推动教学模式从知识传递转向知识建构,再到知识生成,最终达成知识共生(方海光等,2022;吴河江等,2024)。因此,本研究引入教育智能体应用形式作为第三类调节变量,包括功能、反馈形式、人机协同方式与教学模式。
基于以上变量的梳理分析,本研究构建了教育智能体对学生学习表现提升效果的元分析框架(见图1)。
图1 教育智能体对学生学习表现提升效果的元分析框架
2.数据来源
(1)文献检索
为确保文献的代表性与全面性,本研究主要在中国知网、万方、Web of Science、Scopus等电子数据库进行文献检索,类型包含期刊论文、会议论文和学位论文。中文文献以「教育智能体」或「教学代理」或「生成式人工智能」或「聊天机器人」并含「学习」或「学习表现」或「学习效果」作为检索条件,英文文献以「Chatbot」或「Generative AI Agent」或「ChatGPT」或「Pedagogical Agent」或「Teaching Agent」并含「Learning」或「Learning Effect」或「Learning Experience」作为检索条件,中英文文献检索字段均为题名、摘要、关键词。文献发表时间限定为2015—2024年。为避免遗漏,本研究还采用滚雪球方式进行引文回溯,确保文献检索的全面性。最终,共检索到中英文文献5236篇。
(2)文献筛选
为提高元分析的科学性和有效性,本研究按照以下标准筛选文献:①研究内容涉及教育智能体对学习表现的影响;②研究方法为实验或准实验,自变量为学习过程中是否使用教育智能体,因变量为学习表现;③研究设置了实验组和对照组以比较学习表现差异;④研究结果中包含样本量、平均值、标准差。此外,本研究剔除了以不同格式发表的同一项研究。
基于上述标准,由两位研究者分别负责不同数据库的文献筛选,初步筛选完成后将结果合并,并就存在争议或疑似重复的研究进行讨论。首先,重复文献被排除,获得中英文文献5116篇。随后,阅读标题、摘要和关键词,排除非实验研究和实验或准实验研究与研究主题不相关的研究,获得378篇文献。此后,去除无法获得全文的文献57篇,对剩余文献进行全文阅读,排除实验对象非学生、没有报告具体学习表现指标或数据不完整的研究。最终获得87篇文献,其中中文文献7篇,英文文献80篇,共得到121个效应量(其中部分实验与准实验研究包含多个独立效应量)。
3.文献编码
本研究根据前文提出的教育智能体对学生学习表现提升效果的元分析框架制作编码框架(见表1),对文献来源、学科、学段、教育智能体的设计特征与应用形式、学习表现及效应值统计项进行编码。其中,效应值统计项包括实验组与对照组的样本量、均值、标准差。两位研究者对编码维度和类别协商达成共识,对87篇研究进行背对背独立编码,经检验编码一致性可接受(Cohen’s Kappa=0.904)。
表1 编码框架
4.数据处理与分析
本研究利用Comprehensive Meta-Analysis 3.7软件录入原始研究的样本量、均值、标准差,由这3个数值计算各研究的效应量,并通过效应量大小评估影响程度。本研究选取Hedges’ g作为效应量类型,以减弱小样本研究对效应估计的偏倚。Hedges’g是一种基于标准化平均差的效应值,对Cohen’s d进行了有偏修正,适用于样本量较小的研究情境,可更准确地反映不同组间的真实效应大小(Hedges,1981)。鉴于各研究设计的可变性,本研究使用随机效应模型估算整体效应大小,并通过异质性检验验证模型选择的合理性。最终,本研究纳入元分析的总样本量有8565个。
1.发表偏倚检验与异质性检验
为评估样本是否存在发表偏倚,本研究采用漏斗图、Egger回归检验及失安全系数(Fail-Safe N)进行多重检验。首先,漏斗图(见图2)显示效应值分布大致对称,仅边缘存在少量异质点,初步表明发表偏倚风险较低。其次,Egger线性回归检验结果不显著(p=0.4849>0.05),进一步表明研究样本不存在发表偏倚。最后,Rosenthal失安全系数为6919,远高于判断标准(5n+10=645),说明即便有大量未发表研究结果也难以推翻当前元分析结论。因此,可以认为本研究样本不具有显著发表偏倚,所获得效应值具备较强的稳健性与解释力。
图2 发表偏倚漏斗图
为判断研究效应值之间是否存在显著异质性,本研究采用Q检验与I2指标进行分析。表2显示,Q检验结果显著(Q=791.606,p<0.001),提示研究间效应量存在显著异质性;I2值为84.841%,根据Higgins等人(2003)提出的界限标准,超过75%被视为高度异质性,表明不同研究结果之间存在较大变异。鉴于异质性显著且研究背景与测量方式可能存在差异,本研究选用随机效应模型以更合理地估计总体效应量并解释变异来源。后续将进一步开展调节变量分析以探讨异质性的具体来源。
表2 异质性检验结果
(注:***p<0.001,**p<0.01,*p<0.05;下同。)
2.教育智能体对学习表现的提升效果分析
基于对学习表现的界定与分类,本研究分别从认知能力与非认知能力两个维度展开实证分析,探讨教育智能体对学习表现的整体效应与差异表现。
(1)总效应量分析
本研究最终纳入了121个独立效应量,效应值范围为-4.038~2.374,其中有36项研究报告为负向影响。在此基础上,采用随机效应模型估计教育智能体对学生学习表现的总体影响。根据Borenstein等人(2021)的效应量划分标准,效应值小于0.2为小效应,大于等于0.2且小于0.5为中等偏小效应,等于0.5为中等效应,大于0.5且小于0.8为中等偏大效应,大于等于0.8为较大效应。表3显示,学生学习表现的整体效应值为0.337(p<0.001),表明教育智能体对学生学习表现具有中等偏小的正向促进作用。这进一步说明,在学生学习过程中合理运用教育智能体,在总体上有助于提升学生的学习表现。
表3 教育智能体对学习表现的整体影响
(2)学习表现的差异分析
教育智能体对不同类别学习表现的影响如表4所示,教育智能体对学生认知能力(Hedges’g=0.381,p<0.001)、非认知能力(Hedges’g=0.297,p<0.001)均具有中等偏小的作用效果。组间效应检验结果不显著(p>0.05),说明教育智能体对两类学习表现的影响无显著差异。
表4 教育智能体对不同类别学习表现的影响
随后,本研究结合纳入分析的文献中认知能力、非认知能力的具体指标,进一步探究教育智能体对学生学习表现的影响,如表5所示。
表5 教育智能体对学生认知、非认知能力的影响
在认知能力维度,教育智能体对学生表达交流能力具有较大的促进效应(Hedges’g=1.065,p<0.01),对成绩表现具有中等偏小的促进效应(Hedges’g=0.323,p<0.01)。同时,教育智能体虽然对知识掌握有中等偏小促进效应,对问题解决能力有较小促进效应,但结果并不显著。组间效应值检验结果不显著(p>0.05),表明教育智能体对各维度认知能力的影响差异无统计学意义。需要指出的是,表达交流能力对应的效应值较高,可能受到了纳入研究数量有限、测量工具异质性等因素的影响。
在非认知能力维度,教育智能体对学生数字素养(Hedges’g=0.481,p<0.01)、自我效能感(Hedges’g=0.412,p<0.05)均具有中等偏小促进效应。同时,教育智能体虽然对学习动机具有中等偏小促进效应,对学习投入、学习兴趣具有较小促进效应,但并不显著。组间效应检验结果不显著(p>0.05),说明教育智能体对非认知能力各维度的效应不具有显著差异。
(3)单、多教育智能体对学习表现的影响
由表6可知,无论是单教育智能体还是多教育智能体,其使用对学生认知能力的作用效应均大于非认知能力,且对二者的促进作用中等偏小。组间效应检验结果(p>0.05)说明,单、多教育智能体对学习表现各维度作用效应无差异。
表6 单、多教育智能体对学习表现的影响
从表7可以看出,单教育智能体与多教育智能体在功能、反馈形式、协同方式和教学模式四大应用形式上对学习表现的调节作用存在明显差异。从具有统计学意义的维度来看:①总体而言,单教育智能体在各应用形式维度上均存在显著调节作用,而多教育智能体在整体上未呈现出显著调节效应。②功能方面,单教育智能体在「个性化资源」功能和「学习路径推荐」功能上呈现中等偏大的作用效应,明显优于多教育智能体。③反馈形式方面,单教育智能体在音频反馈形式中表现更佳,在文本反馈形式中稍低于多教育智能体。④协同方式方面,「师—生—机」协同方式下,单、多教育智能体均呈现中等偏大的作用效应;「生—机」协同方式下,单教育智能体的作用效应略低于多教育智能体。⑤教学模式方面,单教育智能体应用于「知识建构」为导向的教学模式中的作用效应略低于多教育智能体,而应用于「知识生成」「知识共生」为导向的教学模式中的作用效应优于多教育智能体。综上可见,单教育智能体在调节学习表现方面表现出更为稳定和显著的正向效应,而多教育智能体尽管在某些应用中也展现出潜力,但整体作用尚不稳定。
表7 单、多教育智能体的应用形式对学生学习表现的影响
3.不同调节变量对学生学习表现的影响
为探索各研究效应值显著异质性出现缘由,需在编码数据的基础上展开亚组分析(即调节变量分析)。
(1)学科和学段的调节效应
教育智能体作为智慧学习的得力助手,已应用于各学段和学科教学中,但不同学科(Q=1.222,p>0.05)、学段(Q=5.483,p>0.05)借助教育智能体开展教学的效果差异均不明显,说明两者不是影响教育智能体使用效果的决定性因素。
教育智能体在不同学科领域中的作用效应值由高到低依次为医学教育(Hedges’g=0.515,p<0.05)、自然科学(Hedges’g=0.362,p<0.01)、人文社科(Hedges’g=0.350,p<0.001)、工程技术(Hedges’g=0.245,p<0.05);其对小学(Hedges’g=0.615,p<0.001)、中学(Hedges’g=0.435,p<0.001)、大学(Hedges’g=0.260,p<0.001)学生均能产生显著促进作用。总体而言,教育智能体在不同学科和学段中的作用均超过 0.2,因而都值得推广和尝试。
(2)教育智能体设计特征的调节效应
就GAI集成情况而言,组间效应显著(Q=10.591,p<0.01),说明是否集成GAI对学生学习表现存在调节作用,且集成GAI的教育智能体(Hedges’g=0.620,p<0.001)对学生学习表现的提升效果强于普通的教育智能体(Hedges ’g=0.248,p<0.001)。
就智能体数量而言,组间效应不显著(Q=0.052,p>0.05),说明是否为多教育智能体对学习表现的调节作用并无显著差异。单教育智能体(Hedges’g=0.332,p<0.001)、多教育智能体(Hedges’g=0.362,p<0.01)均展现出中等偏小的学习表现促进潜力,且二者效应值较为接近。
就角色设定而言,组间效应显著(Q=13.617,p<0.01),说明教育智能体的角色设定对学习表现存在调节作用。对效应强度进行区分可知,评价者角色(Hedges’g=0.615,p<0.01)、专家角色(Hedges’g=0.609,p<0.001)的教育智能体对学习表现有较强的促进作用,教师角色智能体(Hedges’g=0.166,p<0.05)的促进作用虽然显著但最小,而同伴角色智能体的促进作用不显著。
就社会特征而言,组间效应显著(Q=24.896,p<0.001),说明教育智能体的社会特征对学习表现存在调节作用。具体而言,侧重交互风格设计的教育智能体对学生学习表现具有中等的促进作用(Hedges’g=0.493,p<0.001),侧重外貌设计的教育智能体仅有较小的促进作用(Hedges’g=0.329,p<0.01)。而侧重性别、表情、动作和声音设计的教育智能体对学习表现的调节作用均不显著。
(3)教育智能体应用形式的调节效应
从功能角度看,组间效应显著(Q=12.504,p<0.01),说明教育智能体的功能对学生学习表现存在显著的调节作用,且用于个性化资源提供(Hedges’g=0.537,p<0.001)比学习路径推荐(Hedges’g=0.329,p<0.01)更有效。而当用于伴学辅导和情感支持时,教育智能体对学习表现的促进作用并不理想。
从反馈形式角度看,组间效应显著(Q=40.980,p<0.001),说明教育智能体的反馈形式对学生学习表现存在调节作用。按照效应值大小排序发现,音频方式(Hedges’g=0.753,p<0.001)具有最强的促进效果,其次是文本方式(Hedges’g=0.502,p<0.001)。而采用视频、动作或VR/AR等反馈形式的教育智能体则对学习表现的促进作用不显著。
从协同方式角度看,组间效应显著(Q=8.723,p<0.01),说明教育智能体的不同协同方式对学生的学习表现存在显著差异。从效应值来看,「师—生—机」协同方式(Hedges’g=0.575,p<0.01)对学习表现具有中等偏上的显著促进效果,而「生—机」协同方式(Hedges’g=0.228,p<0.01)的促进效果中等偏小。
从教学模式角度来看,组间效应显著(Q=18.717,p<0.001),说明在不同教学模式下应用教育智能体会显著影响学生的学习表现。教育智能体应用于「知识生成」导向的教学模式中对学习表现具有中等偏大的促进作用(Hedges’g=0.734,p<0.001);应用于「知识建构」导向的教学模式中对学习表现具有中等偏小的促进作用(Hedges’g=0.386,p<0.001);应用于「知识共生」导向的教学模式中对学习表现具有中等偏小的促进作用(Hedges’g=0.342,p<0.01);而应用于「知识传递」导向的教学模式中对学习表现的促进作用不显著(Hedges’g=0.021,p>0.05)。
1.研究讨论
(1)教育智能体对学习表现影响的主效应
本研究基于87篇实证研究文献进行元分析发现,教育智能体对学生学习表现整体呈现中等偏小的促进作用,其中对认知能力的促进效应高于非认知能力。该结果与已有研究一致,表明教育智能体能够通过个性化内容推送与学习路径推荐等方式,提升学生的任务完成效率与表达清晰度(刘清堂等,2019;唐烨伟等,2023)。尤其是在标准化评价中,教育智能体更容易展现其在认知加工支持上的优势(周晓燕等,2023)。
然而,进一步分析发现,教育智能体对数字素养的促进效应显著高于其对整体认知能力及其他非认知能力变量的影响。这也说明,对教育智能体的过度依赖可能抑制深度学习能力的发展(翟雪松,2024)。高频使用集成GAI的教育智能体可能减少学生在学习过程中对实践、推理、验证与反思等环节的投入,导致知识理解浅层化与思维同质化,进而阻滞自身高阶能力发展(姜华等,2023)。亦有研究指出,长期依赖教育智能体提供现成答案,可能削弱学生的认知加工与主动建构能力,甚至引发对信息质量的焦虑与不信任(Lin et al.,2025)。这种「快餐式学习」虽可带来短期便利,却不利于长期能力发展,其应对与防范也对教师的教学设计提出了更高的要求。
值得注意的是,认知能力与非认知能力的效应值组间差异未达统计显著,这一结果可能源于多方面原因。其一,认知能力如知识掌握、成绩表现等常选择标准化测验,测验稳定性更高;而非认知能力如学习投入、学习兴趣等的测量方式主观性更强,标准误差更大,导致效应不够稳定。其二,当前教育智能体主要在资源推荐、学习引导等认知能力层面提供功能支持,而在学习动机、学习投入、学习兴趣等非认知能力层面的功能支持不够,尤其在学习激励、情感支持方面呈现出一定差异性。其三,纳入研究的非认知能力维度的样本数量较少,也影响了相应效应量的检验能力。
此外,教育智能体对学习表现的促进效应仅处于中等偏小水平,且在不同反馈形式与交互风格下有所差异。一方面,当教育智能体在输出语言信息时过度叠加动作、表情等非语言信息,可能加重学生的认知负荷,干扰其注意与信息加工,甚至使其产生迷失感(Fountoukidou et al.,2019)。另一方面,若教育智能体缺乏有效的认知支架或教师引导,学生虽可在短期内获得便利,却可能形成依赖性,削弱其独立思考与探索能力(Bastani et al.,2024)。因此,在教育智能体设计中融入认知发展规律与个性化支持机制尤为重要。
(2)教育智能体对学习表现影响的调节效应
调节变量分析显示,教育智能体对学习表现的影响因学段、学科不同而存在差异,其效果可能与学生认知基础与学科特性密切相关,这与Dever等人(2024)的应用建议相吻合。除学段或学科外,影响教育智能体成效的关键还在于其GAI集成情况。集成GAI的教育智能体对学习表现的促进效应显著更高,这主要得益于大语言模型在自然语言理解与生成方面的进展,其在上下文理解、逻辑推理中表现出卓越性能(卢宇等,2024)。学生通过连续提问即可获得系列反馈,有助于促进其深度思考。
教育智能体数量方面,整体上未发现单、多教育智能体间存在显著主效应差异,但两者各有优势。单教育智能体在个性化资源推送、学习路径推荐等结构清晰、反馈及时的任务中更具成效,更适合认知基础较弱或学习策略尚未成熟的学生群体。多教育智能体更适配探索性任务、协同对话类高阶情境,在促进复杂任务解决和支持高阶思维方面具备更强潜力。一方面,多教育智能体扮演角色的多样性有助于激发学生多视角思考,逐层解析复杂问题(翟雪松等,2024);另一方面,多教育智能体中的各个分支智能体具备明确的专业分工与协作机制,能在学生的知识获取与问题分析中提供更具针对性的支持(郭鑫等,2023;Guo et al.,2024)。但学生在实际使用多教育智能体过程中,面对碎片化的信息与复杂的交互途径,可能难以找到适合自身认知特点的角色组合,容易产生迷失感与心理负担,从而无法集中精力构建有效的知识结构(Duffy et al.,2015)。这也与Dincer等人(2015)的研究结论一致,多教育智能体的角色一旦与学生角色匹配失效,不仅不能提升学习表现,还会干扰学生对学习目标的聚焦与控制感。
教育智能体功能方面,个性化资源推送效果最强,其次为学习路径推荐,这表明当前教育智能体最有效的应用形式仍集中于认知任务的组织与内容分发,以支持学生按需获取知识、优化学习流程(刘清堂等,2019;唐烨伟等,2023)。相比之下,教育智能体在伴学辅导和情感支持方面对学习表现的促进作用尚不显著,且亦有研究指出其在情绪识别与持续反馈方面存在反馈延迟或交互质量不高的问题(Fountoukidou et al.,2019),说明当前教育智能体的设计尚未充分实现情感智能和个体共情。
角色设定方面,扮演「专家」与「评价者」的教育智能体应用效果显著强于「教师」或「同伴」,这表明具备权威性与诊断功能的角色更利于学生学习动机激发与目标导向行为的建立(Dever et al.,2024;顾小清等,2025)。此外,教育智能体的社会特征方面,仅交互风格显著影响学习表现,说明学生对教育智能体的接受程度更多取决于互动自然性与回应节奏,而非表层形象(Lin et al.,2025)。
反馈形式亦是重要的调节因素。本研究发现音频与文本是最有效的反馈方式,而视频、动作及VR/AR均未展现出显著效应,甚至可能因信息冗余增加学生认知负担(Fountoukidou et al.,2019)。这表明反馈形式的选择应以认知加工的清晰度与聚焦性为前提,而非形式多样性。对协同方式的分析表明,「师—生—机」三元协同比「生—机」协同更能提升学习表现,进一步凸显了教师在智能化教学场景中的引导作用不可替代(吴河江等,2024)。在教学模式方面,教育智能体支持以「知识生成」和「知识共生」为导向的教学模式效果更好,这印证了当前教育技术的价值核心应从信息展示转向思维赋能(方海光等,2022;翟雪松等,2024)。
2.研究启示
(1)基于最近发展区,搭建多层次支架系统共促知识生成
随着集成GAI的教育智能体在教学实践中的迅速普及,越来越多研究者意识到,教育本质在于启迪智慧,因材施教与个性化发展应是其核心目标。教育作为一个复杂的自适应系统(Mason,2008),需充分发挥教师、学生、教育智能体之间的协同效应,基于「最近发展区」理念构建认知支架,提升知识生成的深度与适配度,进而缩小学生知识需求与外部供给之间的差距。
在实践中,教师应结合学生当前发展水平与潜在发展区,设计多层次支架系统,包括营造安全氛围的情感支架、理清任务逻辑的程序支架、丰富输入通道的图形支架以及促进知识建构的生成支架。同时,教育智能体应具备动态调节功能,通过选项提示、分步引导等方式,灵活适配不同能力水平学生的学习需求,从而更有效激发学习动机与探索欲望,推动个性化、深层次的认知建构。
(2)基于多媒体认知学习理论,设计最优模式的多教育智能体
多媒体认知学习理论(Mayer,2005)指出,多通道信息呈现有助于优化学习加工过程。教育智能体通过文本、音频、视频等多模态信息与学习者进行交互,能够激发学习动机与积极情绪,促进新知识的探索与认知迁移(唐烨伟等,2023)。此外,教育智能体还可将分布式信息转化为多感官内容,引导学生开展多通道加工,有效降低认知负担(刘清堂等,2019)。
教育智能体通过个性化资源推送与路径规划,能更好适应学生差异,优化学习流程,有助于增强学生的沉浸感与自主性。然而,在模态输出的设计过程中,教师须警惕「炫技式」展示和「快餐式知识」输出所带来的信息冗余与认知干扰,应回归认知加工规律,确保内容呈现具有清晰性、结构性与适配性,以优化信息的有效输入。
因此,教师应推动构建更轻量化、结构清晰、聚焦垂直领域的多教育智能体系统,强化任务类型与教育智能体结构之间的精细化匹配。借此,多教育智能体系统可通过与教师、学生需求的动态适配,精准识别并干预学生学习中的关键薄弱点,实现适配师生个性化需求的最优组合,辅助教师有效重塑教学流程,促进技术共享、课堂共建、认知决策和知识共生。
(3)基于生成学习理论,以「师—生—机」三元协同应对幻觉输出
教师应始终在教育智能体的特征设计与应用形式中居于主导地位,并整合生成学习策略(Wittrock,1974),以协同推动学生的认知加工过程,促使其对知识表层特征的理解转向对概念本质的深入建构,逐步形成教育智能体支持下的动态知识建构循环。具体而言,教师可运用自我解释、情感支持、问题生成等教学策略,引导教育智能体通过分步提问、反思提示与结构化支架等方式开展互动,避免「直给式」答案所带来的认知惰性。在角色定位方面,教育智能体应同时承担「助教」与「助学」的双重职能,一方面辅助教师进行教学组织与内容管理,另一方面为学生提供个性化的过程支持,从而实现「师—生—机」的深度协同。平台设计也应坚持简洁性与可定制性并重,以减轻教师负担并适配多样化教学场景。然而,当前GAI在教育应用中仍面临「幻觉输出」问题。教育智能体可能生成错误信息,或基于片段内容推演出不准确知识,且缺乏价值判断能力。尽管部分教育智能体已尝试引入「思维链」推理机制以增强逻辑严密性,但在处理复杂任务时,仍存在过度构建、知识更新滞后与共情能力不足等潜在风险。
因此,建议教师针对教育场景优先开展权威数据与专业知识的精细化训练,提升教育智能体在任务识别与信息推理中的精度与稳定性。同时,应注重推动大模型知识向小模型架构迁移,实现教育智能体在垂直专业化、轻量部署与多场景适配中的深度协同与可持续发展。
《 2025 AI 赋能教育行业趋势图谱》纸质版正式上线!点击小程序立即购买⬇
很赞哦!(622)
上一篇: 牛弹琴:白宫版智斗,特朗普果然大杀四方
下一篇: 全国首台国产商业电子束光刻机在杭“出炉”